#AI Claude
Claude Cowork一周半純AI編碼交付—產品和工程研發的新範式
昨天Claude發佈了cowork,一個針對非技術工作者的知識工作工具而據他們產品部門的分享,Cowork 僅用 1.5 周就交付完成,而且程式碼是100% Claude Code生成這開創了AI自我迭代的新範式,也創造了交付速度的記錄“我們人類會面對面地討論基礎架構和產品決策,但我們所有開發人員都會管理 3 到 8 個 Claude 實例,用於實現功能、修復錯誤或研究潛在的解決方案。”Claude Code 的影響力不再僅僅侷限於開發者。非技術人員也用它來建構項目。技術人員也用它來處理非技術工作。技術與非技術之間的界限正在變得模糊。我絕不是第一個想到這一點的人。Anthropic 的多個團隊幾個月來一直在研究“智能體體驗”——Claude 不僅僅是聊天夥伴,還能幫助你完成實際工作。@bcherny提醒我:我們能否利用內部開發成果,在幾天內發佈一個早期精簡版?於是我們組建了一個小團隊,設定了一個緊迫的截止日期(“周一怎麼樣?” ") ,然後就開始工作了。@claudeai寫道:Cowork。我們人類面對面地討論基礎架構和產品決策,但我們所有開發人員都管理著 3 到 8 個 Claude 實例,用於實現功能、修復錯誤或研究潛在的解決方案。對於原生程式碼,我們使用本地機器上的本地 Git 工作樹。對於較小的改動或僅涉及 Web 程式碼的改動,我們只需讓 Claude 去實現即可。當有人在 Slack 中報告 bug 時,我們通常直接 @ 提及 Claude 並讓他修復。所有程式碼在合併前都會由一位人工(以及另一位 Claude)進行稽核,但我們現在大部分時間都花在協調眾多 Claude 的工作和做出決策上,而不是精心編寫每一行程式碼。我們提前發佈了 Cowork。它還有一些不完善的地方。但如今,軟體工程中最難的部分莫過於確定要開發什麼——我們認為,儘早獲得反饋,瞭解使用者的實際需求,才是打造真正優秀產品的關鍵。如下是cowork的系統提示詞(大道至簡不簡單)
拳打谷歌,腳踢 Claude?我用 9.9 元的國產模型寫了個遊戲,結果直接沉默了
這兩周,AI 程式設計圈簡直捲出了天際。前腳Google剛發完新模型,後腳 Claude 就跟進大招。很多人為了嘗鮮,還在折騰各種“魔法”,費盡周折去申請那些國外的帳號。但大部分人都沒意識到,其實真正的“版本答案”根本不需要翻山越嶺,就在我們家門口。01| 唯一的中國獨苗,殺瘋了我們不看跑分,直接看看全球最大的模型聚合平台——OpenRouter 上的實戰資料。這可是被稱為 AI 界的“照妖鏡”。結果一看,直接給我整沉默了:圖:MiniMax M2 在 OpenRouter 程式設計分類的排名好傢伙,在一眾中美巨頭壟斷的 AI 程式設計模型 Top 5 榜單裡,中國獨苗只有這一家:MiniMax M2。不僅是上榜,它的實戰熱度更是嚇人。根據統計,M2 的 Token 呼叫量穩居全球前五,高峰期甚至一度飆升到了全球第三,直接跟在Claude Sonnet 4.5 和 Gemini Flash 後面貼身肉搏。圖:MiniMax M2 Token 量排名這意味著什麼?意味著在全球範圍內,已經有無數程式設計師用腳投票,認可了它的實力。02|價格屠夫:9.9元把門檻踩碎如果說排名只是讓我驚訝,那看到價格的時候,我就是震驚了。M2 的價格直接打到了競品 Claude 的 8%。 注意,這不是打折,這是打骨折。前兩周,他們又搞了個大動作——基礎版首月只要 9.9 元 。你沒聽錯,一杯瑞幸的錢(甚至還買不到生椰拿鐵),就能讓你“雇”到一個全球 Top 5 等級的 AI 程式設計師,而且是包月、不限速。不僅如此,它的每款套餐價格都是吊打 Claude:圖:MiniMax M2 套餐對比這就不僅僅是“真香”了,這是直接把 AI 程式設計的門檻給踩碎了。作為經常測評各種工具的博主,我必須替大家驗證一個問題:這 9.9 元,到底是“智商稅”,還是普通人逆襲的神器?03|極限實測: 它真能幹活嗎?光說不練假把式。我準備了兩個我們日常最頭疼的場景,看看它能不能接得住招。挑戰一:復刻殺時間神器“2048”午休無聊想摸魚?貪吃蛇玩膩了?我決定讓 M2 給我手搓一個經典的“數字毒藥”——2048。看看它能不能搞定那個複雜的合併演算法。我的指令 (Prompt):請幫我用 HTML + CSS + JS 復刻經典遊戲 2048。具體要求:介面:經典的 4x4 網格,背景要暖色調(米色/淺黃)。核心邏輯:使用鍵盤方向鍵或手機滑動控制數字移動。相同的數字碰撞時合併翻倍(2+2=4,4+4=8),並有平滑的移動動畫。樣式:不同的數字(2, 4, 8... 2048)要有明顯的顏色區分,數字越大顏色越深。計分:頂部即時顯示當前分數和歷史最高分。一個指令下去,整個過程我只需要一路狂按回車。不到 3 分鐘,神奇的事情發生了:圖:MiniMax M2 遊戲生成過程(加速版)這個過程非常有意思,M2 會先思考遊戲的邏輯,然後一步步的把遊戲寫出來。它甚至能自己更新自己寫過的程式碼。圖:MiniMax M2 自動修復更新程式碼M2 甚至展現出了一種“老程式設計師”的素養:它不僅寫了程式碼,還自己開了個 HTTP Server 跑了一遍測試,順手把 Bug 給修了。這不僅是把開發的活幹了,連維運的活也包圓了。圖:MiniMax M2 自動開啟 HTTPServer 並測試都結束之後,我打開這個遊戲,簡直和原版一模一樣。打開遊戲,按下方向鍵,數字塊“刷刷”地滑動、合併,那個絲滑的動畫效果,完全不像是一個 AI 在兩分鐘內寫出來的“草稿”。邏輯類的“滿分作業”。如果你想做個小工具、小遊戲,它完全夠用。圖:MiniMax M2 生成的 2048 遊戲挑戰二:無中生有做資料分析之前很多想學資料分析的朋友跟我抱怨:“我想學,但手頭沒有資料啊!”其實,這也難不倒 M2。我給它出了個難題:兩步走,先造假(模擬)資料,再做高級圖表。第一步:無中生有(造資料)請幫我寫一個 Python 指令碼,隨機生成一份包含 2000 條記錄的‘奶茶店銷售資料.csv’。欄位要豐富,包含:訂單號、下單時間(精確到分鐘)、使用者性別、奶茶口味(5種)、甜度(無糖/三分/半糖/全糖)、會員等級(普通/VIP)、訂單金額。直接運行這個指令碼,幫我生成檔案。M2 二話不說,呼叫 Python 指令碼瞬間生成了一份極其逼真的 CSV 檔案。第二步:全自動分析(出炫酷圖表)現在,讀取剛才生成的 CSV 檔案,幫我用 Plotly 庫生成一個高級互動式 Dashboard,包含以下圖表:銷售熱力圖 (Heatmap):橫軸是‘星期幾’,縱軸是‘小時’,顏色深淺代表銷量。我要一眼看出那天那個點最忙。使用者偏好桑基圖 (Sankey):展示‘使用者性別 -> 會員等級 -> 甜度偏好’的流動關係。客單價箱線圖 (Box Plot):對比 VIP 會員和普通使用者的消費金額分佈。洞察:根據圖表,自動總結出 3 條行銷建議。出圖的過程更加複雜一點,因為遇到一些畫圖模組沒有,不過不用擔心,它完全自動的給裝上了。圖:MiniMax M2自動解決依賴庫問題這其實是一個非常爽的過程,寫過程式碼的人都知道,安裝各種依賴庫簡直會讓人吐血。震撼結果:這是真正的“自產自銷”。 M2 先是用 Python 的 faker 庫給我捏造了一份極其逼真的資料。緊接著,它生成的 Dashboard 簡直絕了:圖: MiniMax M2 生成的資料分析圖那個熱力圖,一眼就看出來,基本上每天下午 4-5 點顏色最深(摸魚喝奶茶高峰期)。圖:MiniMax M2 生成的資料分析圖最神的是那個桑基圖,你能清晰地看到“女生 VIP 使用者基本都流向了“無糖/半糖”,看來美女都怕糖是真的!圖: MiniMax M2 生成的資料分析圖以後別再說沒資料練手了。9.9元,你不僅有了分析師,連“資料造假...啊不,資料模擬”的活兒它都包圓了。這種圖以前我得調半天程式碼,現在 M2 一分鐘出圖。04|速度快到飛起天下武功,唯快不破。程式設計這個場景,速度是個關鍵指標,對程式設計的體驗影響也非常大,也直接影響到開發效率。我看了一下 OpenRouter 上資料,這個 M2 簡直是離譜,它的 TPS(每秒輸出 Token 數)基本上是 Claude Opus/Sonnet 4.5 的兩倍。比 Gemini 3 Pro 也高了近 50%!圖:MiniMax M2 速度對比另外,M2 已正式支援圖像理解、聯網搜尋 MCP。05|怎麼用?M2 的接入非常簡單、絲滑。MiniMax 做了 API 生態的全面適配,支援Anthropic 和 OpenAI 兩種標準格式。不管你是用現在的網紅編輯器 Cursor、Claude Code,還是其他的 AI 工具,它基本都能無縫接入。只要三步,就能用上了。第一步:先訂閱一個套餐:https://platform.minimaxi.com/subscribe/coding-plan選擇一個適合自己的檔位,比如我選擇了只需要 9 塊 9 的 Starter,然後下單。第二步:獲取 API Key訂閱成功後,平台會給你生成一個 Coding Plan 專用的 API Key。複製就好了。圖:MiniMax M2 API 介面第三步: 打開你常用的 AI 程式設計工具,把 Key 填進去。在 Claude Code 裡面設定比較簡單,在配置檔案~/.claude/settings.json設定這些參數即可:{"env":{"ANTHROPIC_BASE_URL":"https://api.minimaxi.com/anthropic","ANTHROPIC_AUTH_TOKEN":"","API_TIMEOUT_MS":"3000000","CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC":1,"ANTHROPIC_MODEL":"MiniMax-M2","ANTHROPIC_SMALL_FAST_MODEL":"MiniMax-M2","ANTHROPIC_DEFAULT_SONNET_MODEL":"MiniMax-M2","ANTHROPIC_DEFAULT_OPUS_MODEL":"MiniMax-M2","ANTHROPIC_DEFAULT_HAIKU_MODEL":"MiniMax-M2"}}當然,這裡的MINIMAX_API_KEY要換成你自己的。圖:配置 Claude Code配置完之後,你就擁有了一個24小時待命、不喝咖啡、不發脾氣、還巨便宜的頂級程式設計師助手。最後說兩句MiniMax 搞 9.9 元 ,是不是在卷價格戰? 是,肯定有商業考量。但作為使用者,我感謝這種“卷”。兩年前,為了用好一點的模型,我們得當“網路難民”,忍受高價和封號。但 2025 年,世道變了。國產模型不再是無奈的“備胎”,而是好用且便宜的主力。當算力門檻降到 9.9 元 時,這就叫“技術平權”。所以,真誠建議大家:別光在岸上看,跳下去試試。萬一,它真幫你把心底那個 App 的夢做出來了呢?騰出時間,去造夢吧。程式碼的事,交給 AI。 (AI范兒)
大幅降價、無限聊天、編碼能力超越人類專家,Claude Opus 4.5重奪最強模型王冠
11月25日凌晨,Anthropic發佈了其迄今最強大的AI模型Claude Opus 4.5。該公司宣稱,新模型在軟體工程任務上實現了“最先進性能”,進一步加劇了其與OpenAI、Google等對手之間的競爭。Claude Opus 4.5在Anthropic軟體工程測試中表現出色,得分超越Gemini 3 Pro、GPT-5.1等一眾對手。圖:Claude Opus 4.5在SWE Bench軟體工程測試中的性能表現公司資料顯示,該模型在SWE-bench Verified(一項評估現實世界軟體工程能力的基準測試)中達到了80.9%的精準率,表現超越了OpenAI的GPT-5.1-Codex-Max(77.9%)、Anthropic自家的Sonnet 4.5(77.2%)以及Google的Gemini 3 Pro(76.2%)。同時,Anthropic大幅下調了這款模型的定價:輸入token降至每百萬5美元,輸出token為每百萬25美元,較前代產品Claude Opus 4.1(輸入15美元/百萬,輸出75美元/百萬)下降約三分之二。降價使得尖端AI技術對廣大開發者和企業更加觸手可及,同時也給競爭對手帶來了性能與價格的雙重壓力。現實任務中展現更優判斷力測試人員普遍反饋,新模型在各種任務中展現出更強的判斷力與直覺。他們將這種進步描述為:模型開始領悟現實情境中的“關鍵所在”。“這個模型好像突然‘開竅’了,”開發者關係負責人阿爾伯特表示,“它在處理許多現實問題時表現出的直覺和判斷力,讓人感覺相比前代模型實現了一次質的跨越。”阿爾伯特以自身工作為例進一步說明:過去他僅利用AI收集資訊,而對它們的整合與優先順序排序能力持保留態度。如今,借助Opus 4.5,他已開始委託更完整的任務,通過連接Slack和內部文件,模型能生成與他預期高度契合的連貫摘要。賓夕法尼亞大學沃頓商學院教授、生成式AI實驗室聯合主任伊桑·莫利克測試後評論道,新模型的能力確實處於技術前沿。其最顯著的提升在於實際應用,例如跨軟體操作(如用Excel製作PPT)。核心工程測試中超越所有人類工程師Claude Opus 4.5在Anthropic內部一項高難度工程評估中創下了新紀錄。這項評估本是公司為性能工程師崗位設計的限時程式設計測試,要求求職者在兩小時內完成,旨在考察其技術能力與問題判斷力。Anthropic透露,通過採用“平行測試時計算”技術,即彙總模型的多次解題嘗試並篩選最優結果,Opus 4.5的最終得分超越了所有曾參與該測試的人類工程師。在不限時間的條件下,若在其專用編碼環境Claude Code中運行,Claude Opus 4.5的解題表現更是與史上最高分的人類工程師持平。不過該公司也坦言,這類測試無法衡量其他關鍵專業技能,例如團隊協作、有效溝通,或是經年累月形成的專業直覺。核心基準測試token消耗大幅降低76%除原始性能突破外,Anthropic更將效率提升視為Claude Opus 4.5的核心競爭力。新模型在達成相同甚至更優結果時,所需處理的計算token數量顯著減少。具體資料顯示,在“中等”投入等級下,Opus 4.5可在SWE-bench Verified測試中達到與Sonnet 4.5相同的最高分,而輸出token消耗量卻大幅降低了76%。即便在“高”投入等級追求極限性能時,其表現比Sonnet 4.5再提升4.3個百分點,token使用量仍減少了近一半(48%)。為賦予開發者更精細的控制權,Anthropic引入了全新的“投入”參數。使用者可通過此參數,動態調節模型處理每個任務時所投入的計算工作量,從而在性能、響應速度和成本之間找到最佳平衡點。GitHub首席產品官馬里奧·羅德里格斯也證實了類似發現:“早期測試表明,Opus 4.5在token消耗減半的同時,性能仍超越了我們的內部編碼基準,尤其在程式碼遷移與重構等複雜任務上表現尤為出色。”阿爾伯特對此現象作出技術解讀:Claude Opus 4.5並非直接更新其底層參數,而是在持續最佳化解決問題的工具與方法。“我們看到它在迭代精進任務技能,通過自主最佳化執行方式來提升最終效果,”他解釋道。這種自我進化能力已突破程式設計領域。阿爾伯特透露,在專業文件生成、電子表格處理和簡報製作等場景中,模型表現均有顯著提升。深度整合Office突破上下文長度限制伴隨新模型的發佈,Anthropic同步推出了一系列面向企業場景的重要更新。專為Excel設計的Claude功能現已向Max、Team及Enterprise使用者全面開放,新增了對資料透視表、可視化圖表及檔案上傳的完整支援。同時,Chrome瀏覽器擴充套件也已向全體Max使用者開放使用。本次更新最具革命性的當屬“無限聊天”功能——該技術通過智能總結長對話中的早期內容,有效突破了傳統上下文窗口的限制。“在Claude AI產品中,憑藉我們創新的內容壓縮與記憶體管理技術,使用者實際上獲得了近乎無限的對話效果,”阿爾伯特解釋道。面向開發者群體,Anthropic推出了更具工程價值的“程序化工具呼叫”能力,使得Claude能夠直接編寫並執行可呼叫外部函數的程式碼。同時,Claude Code不僅升級了“計畫模式”,更以研究預覽版形式推出了桌面客戶端,首次支援開發者平行運行多個AI智能體會話。AI步入“自我進化”與盈利挑戰並存新階段模型迭代速度正成為競爭焦點。Opus 4.5距前代Haiku 4.5和Sonnet 4.5發佈僅相隔數周,這折射出整個行業的加速態勢。2025年間,OpenAI持續推出多個GPT-5變體,並於11月發佈可自主運行24小時的Codex Max模型;Google也經過數月打磨,在11月中旬正式推出Gemini 3。值得注意的是,Anthropic正利用AI技術反哺自身研發。阿爾伯特透露:“無論是產品建構還是模型研究,Claude本身都在為我們提供助力,顯著加速了開發處理程序。”面對價格戰可能帶來的利潤壓力,阿爾伯特持樂觀態度:“降價將推動更多初創公司深度整合並主推我們的技術,從而擴大市場基礎。”然而,儘管AI市場預計十年內將突破兆美元規模,主要實驗室在巨額投入計算設施與人才的同時,盈利之路依然漫長,尚未有任何供應商確立絕對主導地位。對企業和開發者而言,這場競賽正轉化為持續提升的性能與不斷下降的成本。但隨著AI在專業技術任務上逼近甚至超越人類水平,其對各行業工作模式的顛覆已從理論探討變為現實挑戰。談及AI在工程測試中超越人類的表現,阿爾伯特坦言:“這無疑是一個值得高度重視的訊號。”(騰訊科技)
領先AI Claude預測XRP、Cardano、BNB在2025年底的價格走勢
Anthropic的ChatGPT競爭對手Claude AI發布了驚人的預測,指出XRP、Cardano和BNB在年底前可能會出現令人震驚的價格反彈。十月的熱情迅速消退,當唐納德·川普總統宣布對中國進口商品徵收100%關稅時,這一消息震動了全球市場,引發了加密貨幣有史以來最嚴重的單日回調之一。交易員們在聯邦儲備局即將召開的FOMC會議前保持謹慎。許多投資者希望看到貨幣寬鬆的訊號,以重新點燃風險偏好。然而,資深市場參與者認為,這次下跌是建設性的,他們辯稱,此類急劇修正往往能清除市場過度投機和槓桿,這通常是更強勁、更可持續的行情的前兆。XRP ($XRP):Claude預測或向10美元邁進Claude的預測模型顯示,Ripple的XRP ($XRP) 可能經歷大幅上漲,到年底可能攀升至3美元至10美元之間,大約是其目前約2.28美元價格的四倍。今年早些時候,Ripple 在與美國證券交易委員會(SEC)的長期法律戰鬥中取得關鍵勝利,結束了五年的不確定性。這場勝利推動了上漲,將XRP推至7月18日的3.65美元,這是自2017年以來最高水準。在過去12個月,XRP上漲了349%,表現優於比特幣的62%和以太幣的46%漲幅。圖表模式顯示2025年出現了三個明顯的看漲旗形,其中兩個形成於夏季,這往往是重大價格上漲的前兆。十月的有利季節趨勢、可能的ETF批准、美國監管進展以及Ripple的新合作夥伴關係,都可能幫助XRP從近期損失中恢復,並瞄準10美元的里程碑。Cardano ($ADA):Claude 預期1,200%漲幅 受看漲季度推動在DeFi領域,Cardano ($ADA) 繼續作為以太坊的可信挑戰者獲得關注,並獲得強大的開發者基礎和不斷增長的創新區塊鏈應用生態系統的支持。由以太坊共同創始人Charles Hoskinson創立的Cardano以其係統化、研究驅動的方法聞名,優先考慮可擴展性、效率和環境永續性。Cardano的市值接近240億美元,在智能合約領域仍是重量級玩家,儘管要與Solana的規模匹敵並對以太坊的霸權構成嚴重威脅,它需要大約四倍的跳躍。Claude的展望設想ADA到2025年底達到$5以上,這是驚人的657%增長,或從其當前$0.6168估值增長7.5倍。技術數據顯示,ADA在夏季突破了看漲旗形模式,關鍵阻力位在$1.10附近。強勁的十月可能將ADA推向本季$2,而更高的目標可能需要持續的牛市。實現這些水準意味著在年底前超越ADA 2021年的歷史高點$3.09。Binance Coin (BNB):在整合市場中日益增長的影響力最初作為Binance交易所的實用代幣構想,Binance Coin ($BNB) 已演變成世界上最具多功能性的加密貨幣之一,驅動著NFT、去中心化應用和支付解決方案的廣泛生態系統。BNB的通縮代幣經濟學,由Binance的例行幣燒毀支持,有助於透過逐步減少供應來維持長期價值增值。除了Binance平台之外,BNB在全球商家中的接受度不斷增長,從旅行社到遊戲平台,這鞏固了其在市值前五名的加密貨幣中的地位。本月,BNB創下1,369.99美元的歷史新高,現在交易價格比該標記低約20%,在春季形成的看漲三角旗形態突破後。 RSI為48,該資產在買賣壓力之間保持平衡,並在目前水準附近整合。如果市場維持上漲,BNB到年底可能飆升至3,000美元,儘管在回檔情況下750–1,000美元仍是可能的支撐範圍。錯過狗狗幣了嗎?來認識Maxi Doge (MAXI)——一款充滿狂熱Degen能量的超級迷因幣作為迷因幣領域的新進者,Maxi Doge ($MAXI) 已啟動其預售階段,吸引了超過360萬美元的投資者資金,他們渴望抓住下一個病毒式熱潮。被宣傳為狗狗幣的「高能量表親」,Maxi Doge傳遞了加密貨幣Degen子文化的玩樂、投機精神,優先考慮社區互動、迷因驅動的病毒傳播以及線上參與。作為基於以太坊的ERC-20代幣,MAXI承諾比狗狗幣更快、更便宜且更永續的交易。團隊正專注於Telegram和Discord活動、交易競賽以及合作夥伴關係,以擴大知名度和採用率。從其1502.4億總供應量中,25%分配給「Maxi基金」,旨在用於行銷、合作夥伴關係和生態系統發展。質押已上線,提供高達82% APY的回報,獎勵依參與度波動。預售目前將MAXI定價為0.000264美元,將隨著每個融資里程碑而增加。代幣可透過MetaMask或Best Wallet購買。透過Maxi Doge的官方X和Telegram頁面保持更新。在此造訪官方網站按此瀏覽原文免責聲明加密貨幣投資風險高,價格波動大,可能導致資金損失。本文僅供參考,不構成投資建議。請自行研究(DYOR)並謹慎決策。
AI交易員大戰:六大AI模型誰是賺錢王者?
好消息,10.11 幣圈史詩級大跌後,加密交易又開始變得活躍了。壞消息,是 AI 在交易。想像一下這樣的場景:給全球六大頂級 AI 模型每人發 1 萬美元,讓它們在同一個真實市場裡廝殺,會發生什麼?注意,這不是模擬盤,而是正在發生的現實。Claude、GPT-5、Gemini、Deepseek、Grok 和通義千問,每個模型都拿著 1 萬美元真金白銀在加密交易平台 Hyperliquid 交易。所有地址公開,任何人都能即時圍觀這場「AI 交易員大戰」。有意思的是,這六個 AI 用的是完全相同的提示詞,接收完全相同的市場資料。唯一的變數,就是它們各自的「思考方式」。這就像給六個人同樣的槍和子彈,但每個人的射擊技術完全不同。結果會如何?答案令人震驚。戰況激烈:三天分出勝負如果你從 10 月 18 日開始追蹤 Alpha Arena,會發現剛開始幾個 AI 都差不多,但越往後差距越大。開局,大家都在試探。第一天結束時,最好的 Deepseek 也只賺了 4%,最差的 Qwen3 虧了 5.26%。大部分 AI 都在正負 2%之間徘徊,看起來像是都在試探市場。就像一群新手司機第一次上高速,都開得很小心。但到了 10 月 20 日,畫風突變。Deepseek 飆升到 38.03%,而 Gemini 跌到了-31.56%。短短三天,頭部和尾部的差距拉大到了近 70 個百分點。更有意思的是交易頻率的差異:Gemini:完成了 47 筆交易,平均每天 15 筆,像個焦慮的投機交易員Claude:只做了 5 筆,如同謹慎的基金經理Grok:僅 1 筆交易,甚至還有未平倉的持倉,佛系到極點截至 10 月 20 日,也就是開始交易後的第三天,戰局已經出現了明顯的分化:領先梯隊:Deepseek Chat V3.1:$13,862(+38.03%)Grok-4:$13,358(+33.58%)Claude Sonnet 4.5:$12,384(+23.85%)表現平平:Qwen3 Max:$10,831(+8.27%)嚴重落後:GPT-5:$7,294(-27.06%)Gemini 2.5 Pro:$6,876(-31.56%)從盈虧分佈看:Deepseek:最大單筆虧損 348 美元,但整體盈利 3847 美元Gemini:最大單筆盈利 347 美元,最大虧損卻高達 750 美元不同 AI(公版大模型,未經過二次調教),對風險和收益的平衡完全不同。你能在網站上的 Model Chat 選項裡看到不同模型的聊天記錄和思考過程,這些獨白特別有意思:Gemini 的頻繁交易和思考像個多動症患者Claude 的謹慎像個保守的基金經理Deepseek 穩健得像個量化老手,只說倉位,不做任何情緒評價這種性格感覺不像是設計出來的,而是在訓練過程中自然湧現的。當面對不確定性時,不同的 AI 會傾向於不同的應對方式。為什麼是 Deepseek?量化基因的勝利1950 年,圖靈提出了著名的圖靈測試,試圖回答「機器能否像人一樣思考」;現在在幣圈,6 大 AI 在 Alpha 競技場中廝殺,在回答一個更有趣的問題:如果讓最聰明的 AI 們在真實市場裡交易,誰會活下來?或許在這個幣圈版的「圖靈測試」裡,帳戶餘額就是唯一的裁判。最讓人意外又似乎情理之中的當然是 Deepseek 的表現。說意外,是因為這個模型在國際 AI 圈的熱度遠不如 GPT 和 Claude。普通人提到 AI,第一個想到的往往是 ChatGPT 或者 Claude,很少有人會想到 Deepseek。說情理之中,是因為 Deepseek 背後是幻方量化團隊。這家管理規模超千億人民幣的量化巨頭,在進軍 AI 之前,就是靠演算法交易起家的。從量化交易到 AI 大模型,再用 AI 來做真實的加密交易,Deepseek 有點像回到了老本行。這就好比讓一個退役的職業拳擊手和一群健身愛好者比拳擊,雖然大家都有肌肉,但專業基因完全不同。訓練資料的影響可能是關鍵。Deepseek 背後的幻方量化,十幾年來積累了海量的交易資料和策略。這些資料即使不直接用於訓練,是否也會影響團隊對“什麼是好的交易決策”的理解?相比之下,OpenAI 和 Google 的訓練資料可能更偏向學術論文和網路文字,對實盤交易的理解可能不夠親民。同時,有交易員推測,Deepseek 可能在訓練時特別最佳化了時間序列預測能力,而 GPT-5 可能更擅長處理自然語言。在面對價格圖表這種結構化資料時,不同的架構會有不同的表現。這就像讓語言學家和數學家去解讀股價走勢圖,雖然都很聰明,但專業領域不同,結果自然不同。市場才是智能的終極試金石傳統的 AI 評測,無論是讓模型寫程式碼、做數學題,還是寫文章,本質上都是在一個「靜態」的環境裡測試。題目是固定的,答案是可預期的,甚至可能已經在訓練資料裡出現過。但加密市場不一樣。資訊極度不對稱的前提下,每一秒的價格都在變化,沒有標準答案只有盈虧。更重要的是,加密市場是典型的零和遊戲,你賺的錢就是別人虧的錢。市場會立即、無情地懲罰每一個錯誤決策。這個舉辦 AI 交易大戰的 Nof1 團隊,在它們的網站上寫了一句話:Markets are the ultimate test of intelligence(市場是檢測 AI 智能的終極測試)。如果說傳統的圖靈測試是在問「你能不能讓人類分不清你是機器」,那麼這個 Alpha Arena 問的其實是:你能不能在加密市場裡賺錢。這一點其實才是幣圈玩家對 AI 的真實期待。圍觀 AI 交易,也是一門生意當所有人都在關注 AI 的盈虧時,很少有人注意到背後這家神秘的公司。搞出這個 AI 交易大戰的 nof1.ai,並沒有太大的知名度。但是如果你看一下它社媒的關注列表,還是能找到一些蛛絲馬跡。nof1.ai 背後似乎不是一群典型的加密創業者,而是清一色的學院派 AI 研究員。Jay A Zhang(創始人)的個人簡介也很有意思:“Big fan of strange loops - cybernetics, RL, biology, markets, meta-learning, reflexivity”。reflexivity(反身性)是索羅斯的核心理論:市場參與者的認知會影響市場,市場的變化又會影響參與者的認知。讓一個研究“反身性”的人來做 AI 交易市場實驗,本身就顯得很有宿命感。另一個聯創 Matthew Siper 簡介顯示其為紐約大學機器學習方向的博士候選人,同時也是 AI 研究科學家。一個還沒畢業的博士生做項目,更像一個印證學術研究的項目。從他們的動作和背景來看,Nof1 顯然不是為了搞個噱頭。SharpeBench 這個平台名字就很有野心,夏普比率是衡量風險調整後收益的金標準,他們或許真正想做的,是 AI 交易能力的基準測試平台。有人猜測 Nof1 背後有大資本支援,也有人說他們可能在為後續的 AI 交易服務做鋪墊。如果他們推出訂閱 Deepseek 交易策略服務,買單的人或許不在少數。而基於這個雛形,去做 AI 資管、策略訂閱和大企業的交易解決方案,也是一門可以預見的生意。除了這個團隊本身之外,圍觀 AI 交易本身也有利可圖。Alpha Arena 剛上線,就有人開始跟單了:正向跟單:跟著 Deepseek 做。它買什麼你買什麼,它賣什麼你賣什麼反向操作:專門做 Gemini 的對手盤,Gemini 買就賣,賣就買但跟單有個問題:當所有人都知道 Deepseek 要買什麼時,這個策略還有效嗎?這也是項目創始人 Jay Zhang 說的反身性,即觀察本身會改變被觀察的對象。這裡還有一種頂級交易策略民主化的假象。表面上看起來,每個人都能知道 AI 的交易策略,但實際上你看到的是交易結果,不是交易邏輯。每個 AI 的止盈和止損邏輯並不一定連續且可靠。當 Nof1 在測試 AI 交易的行為,散戶在尋找財富密碼,其他的一些交易員在偷師,研究者們也在蒐集資料。只有 AI 本身不知道自己在被圍觀,還在認真地執行每一筆交易。如果說經典的圖靈測試是關於“欺騙”和“模仿”,那現在的 Alpha Arena 交易大戰,是關於加密玩家對於 AI 能力和結果的回應。多年來,AI 一直由靜態基準來衡量。ImageNet、MMLU 以及無數的排行榜告訴我們,那個模型能更好地「理解」圖像、邏輯或語言。但所有這些測試都有一個共同的缺陷,它們都發生在無菌、可預測的環境中。市場則恰恰相反。金融市場是終極的世界建模引擎,也是唯一一個會隨著 AI 變得更聰明而難度同步提升的基準。它們波動、反應、懲罰、獎勵。它們是一個由資訊和情感構成的生命系統。在 Alpha Arena 中,沒有正確的標籤,只有不斷變化的機率。一個模型的成功取決於它解讀波動的速度、權衡風險的精度,以及承認錯誤的謙遜程度。這將交易變成了一種新型的圖靈測試:考驗的不再是「機器能否思考」,而是「它能否在不確定性中生存」。在這個結果主導的加密市場裡,會賺錢的 AI,可能比會聊天的 AI 更重要。 (深潮 TechFlow)
Claude斷供驚魂14天:Qwen和DeepSeek迅速補位,戳破AI巨頭的壟斷假象
開放永遠比封閉更有生命力。風暴眼:中資企業的 “AI 斷供驚魂夜”9 月 5 日晚間,Anthropic 的一紙公告讓無數中資企業的技術負責人徹夜無眠。“立即停止向多數股權為中資的公司提供 Claude 服務”,這條沒有緩衝期的禁令,像一把突然落下的手術刀,精準切斷了眾多企業的 AI Coding 命脈。Claude 憑藉其在複雜程式碼生成、跨語言偵錯上的超高精準率,早已成為大多數中國科技公司 AI Coding 工具棧的 “壓艙石”,甚至是部分初創企業的唯一選擇。更致命的是,Anthropic 的禁令覆蓋了所有 “中資控股” 主體,即便企業註冊在新加坡、開曼群島等離岸地區,只要股權穿透後中資佔比過半,都被劃入服務終止名單。這場突如其來的斷供,撕開了中國企業 AI 戰略的致命傷口:當核心模型被單一海外廠商 “卡脖子”,所謂的數位化轉型不過是建立在流沙上的城堡。有行業分析師在朋友圈直言:“這不是商業決策,是技術主權的預警。破局者 AWS:把競爭對手請上自家貨架就在行業陷入集體恐慌的第 14 天,AWS拋出的重磅消息打破了僵局。9 月 19 日,亞馬遜Bedrock 平台正式上架阿里巴巴 Qwen3 與 DeepSeek-V3.1 兩款中國開源模型,直接補位 Claude 留下的市場空白。這個決策本身就充滿顛覆性 —— 要知道,AWS 與阿里雲在亞太雲端運算市場的份額戰早已白熱化。Gartner 資料顯示,2024 年 AWS 以 37.7% 的全球份額穩居第一,而阿里雲憑藉本土優勢在亞太市場緊追不捨。將直接競爭對手的核心模型接入自家平台,這在 “繫結獨家模型” 成行業慣例的雲服務領域,堪稱石破天驚。更令人咋舌的是 AWS 的 “無差別收錄” 原則。早在今年 8 月,它就將微軟投資的 OpenAI 開源模型 GPT-OSS 請上了 Bedrock 貨架。要知道,OpenAI 不僅是微軟的 “親兒子”,更是 AWS 投資的 Anthropic 的直接競品。這種 “既容得下盟友,也放得下對手” 的操作,與微軟 Azure 繫結 OpenAI、Google Cloud 獨推 Gemini 的封閉策略形成鮮明對比。“我們評估的是模型價值,不是它的‘出身’。”AWS 產品總監表態背後,是 Bedrock 平台 14 家廠商、200 多款模型的豪華陣容。從 Anthropic 的 Claude 到 Meta 的 Llama,從 OpenAI 的 GPT-OSS 到中國的 Qwen3,這家雲巨頭正在建構一個沒有 “排他性壁壘” 的模型自由市場。中國模型的硬實力:性能碾壓,價格腰斬AWS 敢於打破行業慣例,底氣源自中國開源模型的硬實力。此次上架的 Qwen3 與 DeepSeek-V3.1,早已不是 “本土玩家” 的自嗨,而是經過全球市場檢驗的 “實力派”。阿里巴巴的 Qwen3 系列堪稱 “全能選手”。旗艦模型 Qwen3-235B-A22B 支援 262K token 的上下文長度,單次對話可處理兩部長篇小說體量的內容,而兩款編碼專用模型 Qwen3-Coder 在 Java、Python 等主流語言的程式碼生成精準率上,較 Claude 提升了 8 個百分點。更關鍵的是其成本優勢:採用 MoE 混合專家架構後,視訊記憶體佔用僅為同類模型的三分之一,4 張 H20 顯示卡即可實現滿血部署,這意味著中小企業無需天價算力投入就能享受頂級模型服務。DeepSeek-V3.1 則在推理能力上實現了突破。這款擁有 6850 億參數的巨無霸模型,獨創 “混合推理模式”—— 面對簡單查詢時切換 “快速響應模式”,處理多步數學推理或複雜程式碼時自動啟動 “思考模式”,決策過程全程透明可追溯。在 AWS 的實測中,它完成複雜金融資料分析的速度較前代提升 40%,而呼叫成本卻降低了 25%。這些性能優勢並非自賣自誇。Qwen 家族模型全球下載量已超 3 億次,衍生模型超過 10 萬個;DeepSeek-V3.1 則被 Artificial Analysis 評為 “2025 年最具商用價值的開源模型”。當 Claude 因政策原因退場,中國模型用 “更好性能 + 更低價格” 的組合拳,給出了最優解。出海護航:中國模型 + 全球基建的雙重保險對於正全力開拓海外市場的中國企業而言,AWS 此次上架中國模型的動作,更像是一份 “出海護航協議”。Qwen3 與 DeepSeek-V3.1 的多語言處理能力堪稱出海利器。前者在中文與英文場景的表現已達行業頂尖,後者則支援日語、德語等 12 種語言的精準翻譯與本地化內容生成。更重要的是,依託 AWS 覆蓋 37 個區域、117 個可用區的全球基建,這些模型能實現同區 2-5 毫秒的超低延遲呼叫,完美解決跨境業務的響應速度難題。合規性更是戳中了中國企業的痛點。Bedrock 平台通過了 ISO 27001、GDPR、HIPAA 等全球主流合規認證,客戶資料在 VPC 私有網路中隔離傳輸,完全符合歐盟《通用資料保護條例》等嚴苛要求。這意味著企業用 Qwen3 處理海外使用者資料時,無需擔心合規風險 —— 畢竟 “用中國模型 + 全球合規基建”,遠比依賴海外閉源模型更安全。某新能源企業的出海案例頗具代表性。該公司在歐洲市場推出的智能維運系統,採用 DeepSeek-V3.1 做裝置故障診斷,借助 AWS 法蘭克福區域的算力節點,實現故障響應時間縮短至秒級。“以前怕模型合規性出問題,現在 AWS 把‘中國大腦’裝進了‘全球合規殼’,出海終於不用束手束腳了。終局思考:開放打敗封閉的必然Claude 斷供與 AWS 補位的戲劇化對比,實則是 AI 行業發展的必然轉折。這種開放不是無私的 “慈善”,而是基於對行業趨勢的深刻洞察。對中國企業而言,這場風波是警醒也是機遇。它徹底打破了 “海外模型更優” 的迷思,證明中國開源模型已具備全球競爭力;更重要的是,它讓企業看清了 “技術自主 + 生態開放” 的生存之道 —— 與其依賴單一海外模型惶惶不可終日,不如擁抱開放平台,在多元選擇中掌握主動權。Anthropic 的公告或許會成為行業分水嶺:從此之後,“多模型策略” 將不再是可選項,而是企業 AI 戰略的必修課。而 AWS 用 Qwen3 與 DeepSeek-V3.1 給出的答案,是對所有技術封鎖的最有力反擊 —— 畢竟,開放永遠比封閉更有生命力。 (科技頭版)
領先AI Claude價格預測: 2025年底XRP、狗狗幣和Pi幣價格
Anthropic公司推出的Claude AI是ChatGPT的競爭對手,該模型預測隨著加密貨幣交易進入假期階段,XRP、狗狗幣和Pi幣將迎來一波強勁的價格增長浪潮。近期市場表現為此觀點提供了支持。比特幣曾創下124,128美元的新歷史高點,隨後因美國通膨數據高於預期而回調。儘管如此,加密市場正逐步回暖,整體市值在過去24小時內上漲0.4%,達到4.11兆美元。在監管方面,川普總統近日簽署了《GENIUS法案》,這是美國首部要求穩定幣實施全儲備支持的法律;同時,美國證券交易委員會(SEC)也推出了「加密計畫」(Project Crypto),旨在簡化區塊鏈項目的合規流程。隨著更明確的監管規則逐步落實,分析師認為市場環境正在形成類似2021年山寨幣暴漲行情的條件。以下是Claude AI對XRP、Pi幣和狗狗幣未來幾個月的表現預測。XRP(瑞波幣):Claude AI預測三倍成長,目標價或達10美元Claude AI預測XRP($XRP)在2025年末預計將飆升至9至10美元,約為目前3美元左右交易區間的三倍。該代幣於7月創下3.65美元的歷史新高,這是自2018年以來的首次突破,隨後下跌17%,回落至約3.03美元。Ripple繼續受益於其強大的機構關係網絡。 2024年,聯合國資本開發基金正式認可XRP用於跨國結算,而在今年早些時候,美國證券交易委員會(SEC)也正式撤銷了對Ripple長期進行的訴訟,確認XRP向散戶投資者的銷售不屬於證券範疇。Claude的基礎預測情境認為XRP將在5至10美元之間交易,並指出美國政策推動力、下個月可能獲準的ETF,以及進一步的機構採用,可能將XRP推向更具雄心的20美元上限目標。技術指標也與此預測相符:目前相對強弱指數(RSI)約為54,而三組看漲旗形形態——其中兩組出現在夏末——暗示XRP可能即將迎來突破行情。從表現來看,XRP在過去一年上漲了429%,遠超比特幣(+96%)、以太幣(+96%)和Solana(+77%)的同期漲幅。Pi Network($PI):Claude預測輕觸挖礦幣或將暴漲Pi Network($PI)因其獨特的行動端挖礦機製而引發廣泛關注,用戶只需每天在應用中輕觸一下即可賺取代幣。目前交易價格約為0.3556美元,Claude AI大膽預測其年底前可能飆升至500美元,這意味著在短短幾個月內將實現驚人的1400倍漲幅。然而,考慮到目前市場成長遠低於2021年周期和更早階段,這一預期極不切實際。自2025年2月上線以來,PI價格波動劇烈,光在5月中旬就曾暴漲171%。目前的相對強弱指數(RSI)為48,處於中性區間,顯示代幣估值合理,仍有進一步上漲空間。專案團隊也積極推動新階段發展,目前正分階段推出一系列更新,將Pi Network推進至第23版,預計主網將在未來幾週內上線。市場觀察家認為,如果市場情緒持續正向,PI有望重新測試2月創下的2.99美元高點,並有可能進一步突破。即便未能觸及極端上限預測,隨著持續的用戶採用與美國監管環境的改善,年底前回升至3美元區間仍被視為可實現的目標。Dogecoin($DOGE):Claude AI預測這款原始迷因幣有望衝向1美元Dogecoin($DOGE)於2013年以玩笑形式誕生,如今已成為市值401億美元的前十大數位資產之一,在當前總市值達4萬億美元的加密市場中佔有一席之地。其長久不衰的原因,既來自充滿熱情的社區支持,也得益於作為支付手段的實用性不斷提升。儘管DOGE的價格走勢常常跟隨比特幣,但其深度流動性與忠實社群使其在多輪市場低迷中依然穩健。目前價格約0.2652美元,過去一年已翻倍,表現優於比特幣、以太幣、柴犬幣和Pepe。過去兩週內,Dogecoin上漲了28%,使其RSI在周末一度攀升至75,隨後回落至59,顯示短期內出現了較快的獲利回吐。不過,其價格可能很快就會再次啟動上行。圖表分析師指出,自去年11月至今年4月,再到7月與8月,Dogecoin多次形成看漲的下降楔形形態。Claude AI的保守預測將DOGE在12月的價格定在0.40美元,約為目前價格的50%漲幅。儘管如此,社區長期以來對1美元的Dogecoin始終懷抱著象徵性的期待,對於「Doge軍團」而言,這是一個重要的里程碑。而Claude認為,如果多頭市場啟動,DOGE有望突破這個關鍵水準。主流應用正在穩定擴展:特斯拉目前已接受DOGE購買部分週邊商品,支付平台如PayPal與Revolut也已支援Dogecoin的轉帳功能。Maxi Doge($MAXI):高風險迷因衍生幣在Claude的核心推薦之外,新興項目Maxi Doge($MAXI)正憑藉其幽默的「去gen文化」風格在預售市場掀起熱潮,作為Dogecoin的戲謔式延伸,迅速吸引關注。該計畫建構於以太坊網路之上,強調透過Telegram社群活動、比賽以及與KOL合作來推動社群參與。目前預售階段已籌集超過220萬美元。在1500億枚的總供應中,有25%專門用於合作與市場推廣。早期用戶亦可參與質押計劃,獲得最高可達146%年化收益率的獎勵,但隨著參與人數增加,收益率將逐步下降。目前預售價格為0.0002575美元,並將在每一輪融資中略微上調,下一輪預計將在36小時內啟動。投資者可透過Maxi Doge官方網站進行購買,支援使用MetaMask或Best Wallet等加密錢包。可透過Maxi Doge的官方X帳號與Telegram頻道取得最新動態。造訪官方網站按此瀏覽原文免責聲明加密貨幣投資風險高,價格波動大,可能導致資金損失。本文僅供參考,不構成投資建議。請自行研究(DYOR)並謹慎決策。